Model Selection

Multi-query attention

# Multi-query attention

Transformer encoder pretrained based on Megatron-LM, specifically designed for Japanese scenarios

Large Language Model

Transformers Supports Multiple Languages

Falcon 7B Instruct GPTQ

The 4-bit quantized version of Falcon-7B-Instruct, quantized using the AutoGPTQ tool, suitable for efficient inference in resource-constrained environments.

Large Language Model

Transformers English

Featured Recommended AI Models

AIbase

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

© 2025AIbase